草庐IT

hadoop - Flume NG 和 HDFS

全部标签

hadoop基础:通过 Shell 命令访问 HDFS

文章目录1.HDFSShell概述1.1操作命令管理命令其他命令1.HDFSShell概述HDFSShell是由一系列类似LinuxShell的命令组成的。命令大致可分为操作命令、管理命令、其他命令三类1.1操作命令操作命令是以“hdfsdfs”开头的命令。通过这些命令,用户可以完成HDFS文件的复制、删除和查找等操作,Shell命令的一般格式如下。hdfsdfs[通用选项]其中,hdfs是Hadoop系统在Linux系统中的主命令;dfs是子命令,表示执行文件系统操作;通用选项由HDFS文件操作命令和操作参数组成。(1)创建文件夹命令:hdfsdfs-mkdir[-p]-p]:表示如果父目录

【hadoop】解决浏览器不能访问Hadoop的50070、8088等端口

问题:在虚拟机启动hadoop集群后,在window浏览器无法访问http://master:50070、http://master:8088等集群监控界面。问题排查:首先在windows里ping一下是否能通:若不能ping通,试一下pingIP地址,这里master的IP地址为192.168.128.130.若IP地址能ping通,则试一下在浏览器中将master换成IP地址访问一下:如果能利用IP访问,那么可以在Windows里面C:\Windows\System32\drivers\etc路径用管理员权限之后,编辑hosts文件,加入虚拟机各节点的hostname和IP地址。(竖着写,

centOS 7下Hadoop伪分布式搭建

记录笔记,尝试在centOS下安装Hadoop伪分布式(之前是在Ubuntu下安装的),查漏补缺。步骤第一步:先把在window系统中下载好的关于Hadoop、jdk压缩包用Xftp传输到centos名称自定义,主机我写的是IP地址,需要去centOS的终端输入ifconfig,划黄线的是IP地址  用户名如果在安装centos中没有创建的话,默认是root,密码是登陆密码。点击连接,弹出下面这个对话框,我选的是一次性接受(自行选择)。 成功会亮起小绿点,然后直接把从此电脑中的目标压缩包拖拽到新建会话那边你想放的地方,能记住地址就行。这个地址建议简洁,之后的安装会出现多次。 第二步:设置cen

Hadoop集群安装和搭建(从零开始超级超级详细的过程)(上)

Hadoop集群安装和搭建(从零开始超级超级详细的过程)(上)目录Hadoop集群安装和搭建(从零开始超级超级详细的过程)(上)前言一、Hadoop项目结构二、Hadoop安装方式三、VMware虚拟网络设置+Windows10的IP地址配置+CentOS7静态IP设置(1)VMware虚拟网络设置(2)Window10的IP地址配置(3)CentOS(hadoop100)静态IP设置(5)设置名字解析四、XSHELL7远程访问工具+XFTP7文件传输(1)分别下好XSHELL7和XFTP71)先安装Xshell2)打不开Xshell7的解决方法3)新建XShell文件4)安装Xftp五、基础

云计算系列(2)初识HDFS与MapReduce

云计算系列(2)初始HDFS与MapReduce前言上节课主要是完成了Hadoop的安装,这次主要完成以下内容配置HDFSweb端查看HDFS文件系统配置yarnweb端查看yarn系统配置mapreduce运行MapReduce的WordCount程序上次课完成到如下图的状态还需要改善一下,就是我们在root用户下解压安装他的拥有者是数字不是root通过chown命令更改一下拥有者chown-Rroot:root/opt/wdp运行一下hadoop命令有如下提示说明hadoop可以用Hadoop运行模式(1)本地模式(默认模式):是否启动进程----没有,在几台机器上安装的—1台,不需要启用

VM VirtualBox 实现 Hadoop 3.3.4集群搭建

目录Hadoop集群搭建环境准备安装虚拟机Linux系统网络配置虚拟机克隆SSH服务配置Hadoop集群搭建安装JDK安装HadoopHadoop集群配置Hadoop集群测试格式化文件系统启动和查看Hadoop进程查看Web界面简单使用Hadoop集群Hadoop集群搭建环境准备虚拟机:OracleVMVirtualBox操作系统:Centos8Hadoop版本:3.3.4JDK版本:1.8免密登录(SSH协议):MobaXterm安装虚拟机打开OracleVMVirtualBox并新建虚拟机内存选择选择现在创建虚拟硬盘设置虚拟硬盘文件类型建议动态分配设置虚拟硬盘大小注意:创建完先不要打开,先

Sqoop数据导入 第2关:Mysql导入数据至HDFS上

为了完成本关任务,你需要掌握:1、数据库(MySQL)建表。2、Mysql数据导入至HDFS中。数据库(MySQL)建表用命令进入MySQL客户端。mysql-uroot-p123123-h127.0.0.1创建数据库hdfsdb(格式默认为utf8),并在数据库内建立表student,其表结构如下:mysql>createdatabasehdfsdb;createtablestudent(stu_nointprimarykey,stu_namevarchar(20),stu_ageint);insertintostudentvalues(202001,"zhangsan",18);inser

HDFS Java API操作(IDEA版)

目标通过JavaAPI来操作HDFS,完成的操作有:文件上传、文件下载、新建文件夹、查看文件、删除文件。前提条件1.Windows下安装好jdk1.82.Windows下安装好maven,这里使用Maven3.6.33.Windows下安装好IDEA,这里使用IDEA20214.Linux下安装好hadoop2,这里使用hadoop2.7.3操作步骤1.新建一个Maven工程打开IDEA-->File-->New-->Project选择Maven-->点击Next 选择工程代码存放目录,这个目录需要为一个空目录,目录名称就是工程名称,可以点击ArtifactCoordinates左侧的三角形展

HDFS常用的操作命令

一、显示目录信息(-ls)hadoop fs -ls /二、在hdfs上创建目录(-mkdir)普通创建:hadoop fs -mkdir /xiaolin递归创建:hadoop fs -mkdir -p /xiaolin/xiaoyin三、从本地剪切文件粘贴到hdfs上(-moveFromLocal)mkdirxuan.txthadoop fs -moveFromLocal xuan.txt /xiaolin四、把本地文件复制到hdfs上(-copyFromLocal或者-put)hadoop fs -copyFromLocal xuan.txt /hadoop fs -put xuan.t

Hadoop学习——Hadoop单机运行Grep实例(包含错误解决方法)

1.概述上一篇安装了Hadoop单机,所以今天打算先用Hadoop的mapreduce自带的Grep实例实践一下,顺带测试Hadoop是否成功安装。(不是水博客,有在努力填坑)实践开始之前,我们需要了解一下Grep实例,Grep(缩写来自GloballysearchaRegularExpressionandPrint)是一种强大的文本搜索工具,它能使用特定模式匹配(包括正则表达式)搜索文本。在今天的实例当中我们将创建一个input文件夹,并利用这个工具从该文件夹中匹配到符合正则式“dfs[a-z.]+”的xml文件,自动创建output文件夹并将结果在该文件夹中输出。那么让我们开始吧!2.Gr